#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
@create Time:2018-12-14

@author:Brook
"""
import os


ROOT_DIR = os.path.dirname(os.path.abspath(__file__))


#语料   
CORPUS_DIR = os.path.join(ROOT_DIR, "data")

#未分词的原始文本语料（小黄鸡语料），已经不再生产环境中使用，暂时保留 
CORPUS_PATH = os.path.join(CORPUS_DIR, "xiaohuangji50w_nofenci.conv")

#分词后的json格式语料，格式为一个二元元组，第一个元素是question，第二个元素为answer
#这两个元素都是列表格式。question列表的每个元素也是个列表（句子的分词）；answer的每个
#元素是文本字符串（即未分词）
CORPUS_JSON_PATH = os.path.join(CORPUS_DIR, "xhj.json")


# 模型文件，词向量、分类聚类（sklearn）
MODELS_DIR = os.path.join(ROOT_DIR, "models")
# 由sklearn对语料（question部分）训练的分类（聚类）模型
CLF_MODEL_PATH = os.path.join(MODELS_DIR, "xhjkm.m")

# 可供gesim加载的词向量
WV_MODEL_PATH = os.path.join(MODELS_DIR, "wiki_char_300.bin")
